PDF 지원

Anthropic
Claude에서 열기
이 강좌에 대해 질문하기
노트 복사
LLM용 전체 강좌 노트 복사

Claude는 PDF 파일을 직접 읽고 분석할 수 있어 문서 처리에 강력한 도구입니다. 이 기능은 이미지 처리와 유사하게 작동하지만, 코드 구조에 있어 몇 가지 주요 차이점이 있습니다.

PDF 처리 설정하기

Claude로 PDF 파일을 처리하려면 이미지 처리에 사용하는 코드와 거의 동일한 코드를 사용합니다. 주요 차이점은 파일 형식 지정 및 명확성을 위한 변수 이름에 있습니다.

기존 이미지 처리 코드를 PDF용으로 수정하는 방법은 다음과 같습니다:

with open("earth.pdf", "rb") as f:
    file_bytes = base64.standard_b64encode(f.read()).decode("utf-8")

messages = []

add_user_message(
    messages,
    [
        {
            "type": "document",
            "source": {
                "type": "base64",
                "media_type": "application/pdf",
                "data": file_bytes,
            },
        },
        {"type": "text", "text": "Summarize the document in one sentence"},
    ],
)

chat(messages)

이미지 처리와의 주요 변경 사항

이미지 처리 코드를 PDF용으로 변환할 때 다음 요소들을 업데이트해야 합니다:

  • 파일 확장자를 .png에서 .pdf로 변경
  • 명확성을 위해 변수 이름을 image_bytes에서 file_bytes로 변경
  • 타입을 "image" 대신 "document"로 설정
  • 미디어 타입을 "image/png" 대신 "application/pdf"로 변경

Claude가 PDF에서 추출할 수 있는 것들

Claude의 PDF 처리 기능은 단순한 텍스트 추출을 넘어섭니다. 다음을 분석하고 이해할 수 있습니다:

  • 문서 전체의 텍스트 내용
  • PDF에 포함된 이미지와 차트
  • 표와 데이터 관계
  • 문서 구조 및 서식

이를 통해 Claude는 요약, 데이터 분석, 특정 내용 추출 등 PDF 문서에서 모든 유형의 정보를 추출하는 원스톱 솔루션이 됩니다.

위 예시는 Claude가 PDF로 저장된 지구에 관한 위키피디아 문서를 성공적으로 처리하여, 복잡한 문서 내용을 한 문장으로 이해하고 요약할 수 있음을 보여줍니다.

다운로드